Construction et enrichissement d'une ontologie à partir d'un corpus de textes
نویسنده
چکیده
In this paper, we propose a construction and enrichment process of ontologies from texts. Ontologies are formal structures in which the concepts of a domain and relationships between them are formally defined. An increasing number of papers are dealing with ontologies but their construction and enrichment processes still a problem. Our construction approach is based on terms’s research into texts. It supposes that the frequent associations of two terms in some syntaxic structures could show a semantic relationship and then constitute the elements that could be integreted into an ontology. Terms and syntaxic structures identification is achieved through a partial and robust syntaxic analyser. These elements constitute the database on which operates the extraction process –extraction of frequent itemset– to extract regularities. MOTS-CLÉS : Ontologie, motifs fréquents, fouilles de textes
منابع مشابه
DaFOE : an Ontology Building Platform From Texts or Thesauri?
La construction d'ontologies à partir de textes fait l'objet d'études depuis plusieurs années dans le domaine de l'ingénierie des ontologies (Terminae Aussenac-Gilles et al. (2000), Text2Onto Cimiano & Volker (2005)). Un cadre méthodologique en quatre étapes (constitution d'un corpus de documents, analyse linguistique du corpus, conceptualisation, opérationnalisation de l'ontologie) est commun ...
متن کاملConstruction d'une ontologie du domaine HSE
Résumé : Dans cet article, nous présentons un travail de construction d’une ontologie du domaine de la réglementation Hygiène-Sécurité-Environnement (HSE) concernant les installations industrielles. Ce travail a été mené selon deux approches : l’utilisation de nomenclatures et d’interviews d’experts du domaine pour aider à la compréhension des notions du domaine et à leur conceptualisation et l...
متن کاملReconnaissance automatique de concepts à partir d'une ontologie
Résumé Ce papier présente une approche qui s’appuie sur une ontologie pour reconnaître automatiquement des concepts spécifiques à un domaine dans un corpus en langue naturelle. La solution proposée est non-supervisée et peut s’appliquer à tout domaine pour lequel une ontologie a été déjà construite. Un corpus du domaine est utilisé dans lequel les concepts seront reconnus. Dans une première pha...
متن کاملClassification des compte-rendus mammographiques à partir d'une ontologie radiologique en OWL
Résumé. Dans cet article, nous proposons un système de classification des comptes-rendus mammographiques, reposant sur une ontologie radiologique décrivant les signes radiologiques et les différentes classes de la classification ACR des systèmes BIRADS dans le langage OWL. Le système est conçu pour, extraire les faits issus des textes libres de comptes-rendus en étant dirigé par l’ontologie, pu...
متن کاملConception assistée d'une ontologie à partir d'une conceptualisation consensuelle exprimée de manière semi-formelle
Résumé : Cet article présente une méthodologie assistée de conception d'une ontologie à travers trois méthodes, soit une méthode d'élicitation des connaissances d'un domaine résultant en un modèle semi-formel de ces connaissances, une méthode de formalisation conduisant à la production d’une ontologie et une méthode de validation syntaxique et sémantique de l'ontologie. Les processus de formali...
متن کامل